FILTER MODE ACTIVE

#мультимодальная модель

Найдено записей: 8

#мультимодальная модель18.08.2025

Ovis 2.5: мульти-модальные LLM от Alibaba с нативным разрешением и улучшённым визуальным мышлением

'Ovis2.5 (9B и 2B) от Alibaba улучшает визуальное восприятие и мультимодальное рассуждение с помощью NaViT и опционального режима размышления, достигая топ-результатов среди открытых моделей ниже 40B.'

#мультимодальная модель12.08.2025

Zhipu AI представила GLM-4.5V: открытая мультимодальная модель с контекстом 64К и режимом Thinking Mode

'GLM-4.5V от Zhipu AI — открытая мультимодальная модель с 106B параметрами в фоне и 12B активных параметров, поддержкой 64К токенов и режимом Thinking Mode для сложного визуально-текстового анализа.'

#мультимодальная модель04.08.2025

NASA Представляет Galileo: Революционная Открытая Мультимодальная Модель для Дистанционного Зондирования Земли

NASA представила Galileo — открытую мультимодальную модель ИИ, которая интегрирует разнообразные данные дистанционного зондирования для задач сельского хозяйства и реагирования на чрезвычайные ситуации.

#мультимодальная модель27.06.2025

Google представляет Gemma 3n: компактная мультимодальная модель ИИ для устройств на периферии

Google представил Gemma 3n — компактную мультимодальную модель ИИ, оптимизированную для эффективной работы на периферийных устройствах, обеспечивающую обработку текста, изображений, аудио и видео в реальном времени.

#мультимодальная модель25.06.2025

ByteDance представляет VGR: продвинутая мультимодальная модель с улучшенным визуальным рассуждением

ByteDance представила VGR — мультимодальную модель, которая динамически интегрирует визуальную информацию в процесс рассуждения, значительно улучшая точность и эффективность на бенчмарках зрения и языка.

#мультимодальная модель16.05.2025

Salesforce Представляет BLIP3-o: Открытая Унифицированная Мультимодальная Модель с CLIP Эмбеддингами и Flow Matching для Понимания и Генерации Изображений

Salesforce выпустила BLIP3-o — открытую мультимодальную модель, объединяющую понимание и генерацию изображений с помощью CLIP эмбеддингов и Flow Matching, демонстрируя передовые результаты.